# Common Voiceデータセット

Whisper Kurmanji
Apache-2.0
クルド語のクルマンジ方言に特化した自動音声認識モデルで、Whisperアーキテクチャを微調整したものです。
音声認識 Safetensors その他
W
amedcj
272
1
Whisper Small Ta
Apache-2.0
このモデルは、OpenAIのWhisper Smallをタミル語のCommon Voice 17.0データセットでファインチューニングした音声認識モデルで、単語誤り率(WER)は43.23%です。
音声認識 Transformers その他
W
navin-kumar-j
38
1
Whisper Small Fr
Apache-2.0
これはフランス語データセットでファインチューニングされたWhisper-small音声認識モデルで、単語誤り率がベースラインモデルに比べて6.793ポイント低下しています。
音声認識 Transformers フランス語
W
mozilla-ai
30
1
Whisper Base Pl
Apache-2.0
OpenAI Whisper-baseモデルをポーランド語Common Voice 17.0データセットでファインチューニングした音声認識モデル
音声認識 Transformers その他
W
marcsixtysix
27
1
Vlzcrz Whisper Small Japanese 2
Apache-2.0
openai/whisper-smallをCommon Voice 17.0データセットでファインチューニングした日本語音声認識モデル
音声認識 Transformers 日本語
V
vlzcrz
28
1
Whisper Large V3 Cantonese
Apache-2.0
Whisper v3を微調整した広東語自動音声認識モデル、Common Voice 17データセットで訓練
音声認識 Transformers その他
W
khleeloo
25
4
Finetuned Whisper Mr
Apache-2.0
simran14/mr-model-hを基に、Common Voice 17.0マラーティー語データセットでファインチューニングされたWhisper小型音声認識モデル
音声認識 Transformers その他
F
simran14
38
1
Wav2vec2 Large Xls R 300m Amharic Demo Colab
Apache-2.0
facebook/wav2vec2-xls-r-300mをcommon_voice_16_1データセットでファインチューニングしたアムハラ語音声認識モデル
音声認識 Transformers
W
DipsankarSinha
18
2
Whisper Large V3 Japanese 4k Steps
Apache-2.0
openai/whisper-large-v3をベースにCommon Voice 16.1日本語データセットでファインチューニングした音声認識モデル、4000ステップ訓練
音声認識 Transformers 日本語
W
drewschaub
94
4
Wav2vec2 Large Xls R 300m Albanian Colab
Apache-2.0
このモデルは、facebook/wav2vec2-xls-r-300mをcommon_voice_albanianデータセットで微調整した音声処理モデルで、アルバニア語関連のタスクに適しています。
音声認識 Transformers
W
Alimzhan
8,810
1
Wav2vec2 Large Xlsr Mvc Swahili
Apache-2.0
このモデルはfacebook/wav2vec2-large-xlsr-53をベースにファインチューニングしたバージョンで、スワヒリ語(Swahili)の自動音声認識タスク専用に設計されています。
音声認識 Transformers その他
W
eddiegulay
9,413
2
Whisper Small Dv
Apache-2.0
OpenAI Whisper-smallモデルをファインチューニングしたディベヒ語(モルディブの公用語)自動音声認識モデル、Common Voice 13データセットでトレーニング
音声認識 Transformers その他
W
voxxer
21
1
Whisper Small Fa
HezarチームがCommon Voiceデータセットのペルシア語部分を基に微調整したWhisper (small) モデルで、自動音声認識タスクに使用できます。
音声認識 その他
W
hezarai
363
11
Tts Thai Last Step
MIT
これはTacotron2アーキテクチャに基づくタイ語テキスト音声変換モデルで、修正されたCommon Voiceタイ語データセットでトレーニングされ、音声は加工されて元の特徴を保持していません。
音声合成 その他
T
lunarlist
42
2
Tts Thai
MIT
Tacotron2アーキテクチャに基づくタイ語テキスト音声変換モデルで、修正されたCommon Voiceタイ語データセットを使用してトレーニングされています
音声合成 その他
T
lunarlist
54
1
Banglaasr
MIT
これはWhisper smallアーキテクチャに基づくベンガル語自動音声認識モデルで、約400時間のMozilla Common Voiceデータセットでファインチューニングされ、単語誤り率4.58%を達成
音声認識 Transformers
B
bangla-speech-processing
782
15
Whisper Large Persian
Apache-2.0
Whisperアーキテクチャに基づくペルシャ語自動音声認識モデル、Common Voice 11.0ペルシャ語データセットでファインチューニング
音声認識 Transformers その他
W
steja
800
12
Whisper Large V2 Kazakh
Apache-2.0
このモデルはOpenAIのWhisper Large V2をカザフ語Common Voice 11.0データセットでファインチューニングした音声認識モデルです
音声認識 Transformers その他
W
DrishtiSharma
40
3
Whisper Tiny Es
Apache-2.0
OpenAI Whisper-tinyモデルをスペイン語データセットで微調整した音声認識モデル
音声認識 Transformers スペイン語
W
arpagon
26
3
Exp W2v2t Zh Cn Wavlm S596
Apache-2.0
microsoft/wavlm-largeモデルを基にファインチューニングした中国語音声認識モデルで、簡体字中国語をサポートし、Common Voice 7.0 (zh-CN)データセットでトレーニングされています。
音声認識 Transformers
E
jonatasgrosman
22
1
Exp W2v2t Fa Hubert S801
Apache-2.0
facebook/hubert-large-ll60kモデルをファインチューニングしたペルシャ語自動音声認識モデルで、Common Voice 7.0ペルシャ語データセットを使用してトレーニングされました。
音声認識 Transformers その他
E
jonatasgrosman
16
0
Exp W2v2t Sv Se Wavlm S42
Apache-2.0
microsoft/wavlm-largeをベースに微調整されたスウェーデン語自動音声認識モデルで、16kHzサンプリングレートの音声入力に適しています。
音声認識 Transformers
E
jonatasgrosman
20
0
Exp W2v2t It Wavlm S895
Apache-2.0
microsoft/wavlm-largeモデルを基にファインチューニングしたイタリア語自動音声認識モデルで、Common Voice 7.0イタリア語データセットでトレーニングされています。
音声認識 Transformers その他
E
jonatasgrosman
42
0
Exp W2v2t It No Pretraining S842
Apache-2.0
ランダム初期化されたwav2vec2モデルを基にファインチューニングを行い、イタリア語音声認識タスク用に開発されました。トレーニングデータにはCommon Voice 7.0(イタリア語)のトレーニングセット分割部分を使用しています。
音声認識 Transformers その他
E
jonatasgrosman
18
0
Exp W2v2t It Xlsr 53 S387
Apache-2.0
facebook/wav2vec2-large-xlsr-53モデルをファインチューニングしたイタリア語自動音声認識モデルで、Common Voice 7.0イタリア語データセットでトレーニングされています。
音声認識 Transformers その他
E
jonatasgrosman
18
0
Exp W2v2t It Wav2vec2 S609
Apache-2.0
facebook/wav2vec2-large-lv60モデルをベースにファインチューニングしたイタリア語自動音声認識モデル、Common Voice 7.0イタリア語データセットでトレーニング済み。
音声認識 Transformers その他
E
jonatasgrosman
18
0
Exp W2v2t Ja Xlsr 53 S109
Apache-2.0
facebook/wav2vec2-large-xlsr-53モデルをファインチューニングした日本語自動音声認識モデル、Common Voice 7.0日本語データセットで学習
音声認識 Transformers 日本語
E
jonatasgrosman
20
0
Exp W2v2t Th Hubert S533
Apache-2.0
facebook/hubert-large-ll60kをベースにファインチューニングしたタイ語音声認識モデル、トレーニングデータはCommon Voice 7.0から取得
音声認識 Transformers その他
E
jonatasgrosman
19
0
Exp W2v2t En Vp Nl S281
Apache-2.0
facebook/wav2vec2-large-nl-voxpopuliモデルを基に微調整した英語音声認識モデルで、Common Voice 7.0トレーニングセットを使用して学習されています。
音声認識 Transformers 英語
E
jonatasgrosman
18
0
Wav2vec2 Large Xls R 300m Hindi Epochs15 Colab
Apache-2.0
これはfacebook/wav2vec2-xls-r-300mモデルをcommon_voiceデータセットで微調整した音声認識モデルで、ヒンディー語をサポートしています。
音声認識 Transformers
W
vai6hav
17
0
Wav2vec2 Large Xls R 300m Tamil Colab
Apache-2.0
このモデルはfacebook/wav2vec2-xls-r-300mをcommon_voiceデータセットでファインチューニングしたタミル語音声認識モデルです
音声認識 Transformers
W
Priya9
21
0
Model Facebookptbrlarge
Apache-2.0
Facebookのwav2vec2-large-xlsr-53-portugueseモデルをcommon_voiceデータセットでファインチューニングしたブラジルポルトガル語音声認識モデル
音声認識 Transformers
M
Vkt
22
0
Wav2vec2 Base Common Voice 50p Persian Colab
Apache-2.0
このモデルはfacebook/wav2vec2-baseをペルシア語データセットでファインチューニングした音声認識モデルで、ペルシア語音声からテキストへの変換タスクをサポートします。
音声認識 Transformers
W
zoha
21
0
Wav2vec2 Base Common Voice Persian Colab
Apache-2.0
このモデルはfacebook/wav2vec2-baseをペルシア語データセットでファインチューニングした音声認識モデルで、主にペルシア語音声からテキストへの変換タスクに使用されます。
音声認識 Transformers
W
zoha
21
0
Wav2vec2 Common Voice Tr Demo Dist
Apache-2.0
このモデルは、facebook/wav2vec2-large-xlsr-53をCOMMON_VOICE - TRトルコ語データセットでファインチューニングした自動音声認識(ASR)モデルで、評価セットで0.3242の単語誤り率を達成しました。
音声認識 Transformers その他
W
cromz22
26
0
Wav2vec2 Large Xls R 300m Turkish Colab Common Voice 8 5
Apache-2.0
これはwav2vec2アーキテクチャに基づくトルコ語音声認識モデルで、Common Voiceデータセットでファインチューニングされ、単語誤り率(WER)は0.3634です。
音声認識 Transformers
W
husnu
22
0
Wav2vec2 Large Xls R 300m Turkish Colab Common Voice 8 4
Apache-2.0
このモデルはFacebookのwav2vec2-xls-r-300mモデルを基に、common_voiceトルコ語データセットでファインチューニングされた音声認識モデルです。
音声認識 Transformers
W
husnu
19
0
Wav2vec2 Xls R 300m Mr Cv9 With Lm
Apache-2.0
Facebook XLS-R-300Mモデルをマラーティー語音声データセットでファインチューニングした自動音声認識モデル
音声認識 Transformers その他
W
anuragshas
23
0
Wav2vec2 Xls R 300m Ur Cv9 With Lm
Apache-2.0
このモデルはfacebook/wav2vec2-xls-r-300mをウルドゥー語音声データセットでファインチューニングした自動音声認識(ASR)モデルです
音声認識 Transformers その他
W
anuragshas
18
1
Common Voice Lithuanian Fairseq
Apache-2.0
Common Voiceデータセットでトレーニングされたリトアニア語自動音声認識モデルで、wav2vec2アーキテクチャとfairseqフレームワークを使用しています。
音声認識 Transformers その他
C
birgermoell
30
0
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase